F10: Stickprov och populationer, observationsstudier och experiment
När vi utgår ifrån ett begränsat datamaterial, och extrapolerar till en mer generell population, utövar vi statistisk inferens
Inferens blir ett viktigt inslag i del 2 av den här kursen, och vi ska börja lägga grunden för det redan idag
Deskriptiv statistik: Beskriva våra data på ett meningsfullt sätt
Inferens: Använda våra data för att dra slutsatser om världen utanför
Vi går ut och frågar folk på stan om de tycker att regeringen gör ett bra jobb
Med hjälp av svaren vi får kan vi lätt beräkna hur stor andel i våra data som tycker si eller så,
\[\text{Andel positiva} = \cfrac{\text{Antal positiva respondenter}}{\text{Totalt antal respondenter}}\]
Den som samlar in data är ofta omedveten om att stickprovet har ett bias
Exempel på bias De Veaux et al (2021), sid 352
Vi har 5 personer i en liten population: \(\{x_1, x_2, x_3, x_4, x_5\}\), och vi vill dra ett stickprov som inkluderar 2 av dessa observationer
Följande stickprov är möjliga, och ska ha samma sannolikhet att bli valda
\[\begin{align*} & \{x_1, x_2\}, \{x_1, x_3\}, \{x_1, x_4\}, \{x_1, x_5\}, \\ & \{x_2, x_3\}, \{x_2, x_4\}, \{x_2, x_5\}, \\ & \{x_3, x_4\}, \{x_3, x_5\} , \{x_4, x_5\} \end{align*}\]
Dessa slides skapades av Karl Sigfrid för kursen Statistik och Dataanalys I och har uppdaterats av Oskar Gustafsson och Valentin Zulj